Introdução ao R

Aula 1, M1

Carolina Musso

Sala de Situação - UnB

Aula de Hoje

  • 1) Apresentação do curso

  • 2) O que é o R

  • 3) Porque o R

O curso R-de-trás pra frente

  • Três módulos:

    1. Introdução a Linguagem R

    2. Trabalhando os dados

    3. Apresentando as análises

  • Cada módulo tem um mês (4 semanas):

  • sendo duas aulas por semana, às Segundas e Quartas-feiras

  • totalizando 8 aulas por módulo.

  • Exercícios de fixação ao final de cada aula

  • Ao final de cada módulo uma tarefa que -> compõe a tarefa principal final

Porque chama “de-trás-pra-frente”?

  • Desde as primeiras aulas, vamos ver “códigos rodando”.

  • Trabalhar de forma intuitiva e ir definindo os conceitos ao longo do curso.

rm(list=ls()) #limpa o ambiente

#Carrega os pacotes
if (!require(pacman)) install.packages("pacman") 
pacman::p_load(tidyverse, data.table, flextable, officer)

Nossa bibliografia (principal)

A primeira semana:

  1. Segunda: Introdução ao R e RStudio: bases e motivações

  2. Quarta: Introdução ao RMarkdown: Relatórios automatizados

Aula de hoje …

Introdução ao mundo dos dados.

  • A base de tudo que vamos falar

  • Vamos pensar de um ponto de vista mais abrangente

  • O que é trabalhar com os dados?

    • Evidências

    • Saber extrair, interpretar e visualizar a partir de muitos números.

  • Já ouviu e expressão: Entra lixo … sai lixo

    • Como ter dados arrumados?

Planilhas

Dados organizados

  • O que é bom para a máquina ler x bom para humanos lerem

  • Capítulo 4 livro

  • O ideal para análise:

    • Cada linha uma observacão

Exemplos base bagunçada

Mas se eu não tiver dados “arrumados”

  • Sempre vai precisar arrumar alguma coisa.

  • Nem tudo está perdido, mas!

    • Vai dar mais trabalho e requer mais habilidades.
  • Então vamos focar em deixar o mais arrumado possível desde o começo!

  • No curso usaremos dados secundários (ou seja, já foram coletados por outras pessoas): note que eles estarão quase sempre nesse formato!

O que é o R

  1. Um programa de análise Estatística?

  2. Uma linguagem de programação?

  3. Um ambiente de programação?

  4. Uma comunidade?

  5. TODAS AS ALTERNATIVAS!

O que é uma linguagem de programação?

  • Instruções que damos para a máquina resolver problemas.

  • Mais flexível e poderoso do que operar somente a interface

Quem criou o R

E o R-Studio?

  • Criado pela empresa RStudio, atualmente Posit

  • Hadley Wickham: Cientista de dados chefe

  • Esforços atualmente para integrar com outras linguagem além do R

Dois softwares

  • Um é a linguagem em si o cérebro: R

  • O outro É a interface: O RStudio

    • Existem outras formas de usar o R, mas a mais intuitiva e a que vamos nos familirizar aqui é por meio do RStudio.

E os pacotes o que são?

  • Extensões do R

  • Teremos uma aula só sobre o uso de pacotes

Instalando o R

  • Vamos seguir as istruções da mantenedora do RStudio, que é a Posit:

    • Instalar. www.posit.co

    • Canto superior direito

  • Tutorial

  • Resumindo: Baixe tanto o R quanto o RStudio e instale ambos seguindo a configuração padrão

Como é a cara do R (sem RStudio)

  • meio assustador não é?

Os Quatro Paineis do R-Studio

(Mais) Material para aprofundamento

Motivação: A revolução dos dados

Lidar com um volume grande e constante de dados!

  • “Houve cinco exabytes de informação criados entre o alvorecer da civilização até 2003, mas essa quantidade de informação agora é criada a cada dois dias, e o ritmo vem aumentando”. - Eric Schmidt, CEO Google

A vida é uma jornada

Análise de dados em saúde

  • Carência desse tipo de conhecimento nos profissionais da área.

    • Muito difícil achar a combinação: Conhecimento em saúde + em análise de dados

Falamos em Excel mas…

  • O R vai muito além!
  • O poder de dominar uma linguagem de programação.

Exemplos

Outras vantagens

  • Gratuito e open source:
    • Vai conseguir usar sempre!
  • Um grande processo colaborativo:
    • O que você imaginar alguém já fez! (E provavelmente vai te ajudar)
  • “Conversa” com outras linguagens e ambientes.
    • LateX, Markdown, Python, Collab, GitHub…
  • REPRODUTIBIBILIDADE DAS SUAS ANÁLISES.
    • Bom pra você e para a ciência!

Cursos

Outras recomendações

Aceite o Desafio!